本文解决了在无监督的2D至3D姿势提升过程中2D姿势表示的问题,以提高3D人姿势估计(HPE)模型的准确性,稳定性和普遍性。在训练期间,所有无监督的2d-3d HPE方法都为模型提供了整个2D运动骨架。我们认为,这是亚最佳和破坏性的,因为在训练过程中独立的2D关键点和预测的3D序列之间引起了远距离相关性。为此,我们进行了以下研究。我们的最大体系结构能力为6个残留块,我们评估了5个模型的性能,在对抗性无监督的2d-3d HPE过程中,每个模型的姿势都不同。此外,我们还显示了在训练过程中学习的2D关键点之间的相关性,并强调了当将整个2D姿势提供给起重模型时引起的不直觉相关性。我们的结果表明,2D姿势的最佳表示是两个独立的段落,即躯干和腿部,每个提升网络之间没有共同的特征。与在整个2D运动骨架上训练的几乎相同的参数计数相比,这种方法在人类36m数据集上的平均误差下降了20 \%。此外,由于对抗性学习的复杂性质,我们展示了这种表示如何在训练过程中改善收敛性,从而更频繁地获得最佳的结果。
translated by 谷歌翻译